import pandas as pd

# 读取a2.xlsx文件
file_path = 'a2.xlsx'
df = pd.read_excel(file_path)

# 确保“资产负债率”列存在
required_columns = ['资产负债率']
missing_columns = [col for col in required_columns if col not in df.columns]
if missing_columns:
    raise ValueError(f"Excel文件中缺少以下列：{missing_columns}")

# 如果“所有权”列不存在，则添加并填充该列
if '所有权' not in df.columns:
    df['所有权'] = df['实际控制人性质'].apply(lambda x: '国有企业' if x.split(',')[0] in ['1100', '2000', '2100', '2120'] else '非国有企业')

# 按照“所有权”分组，并计算资产负债率的均值和方差
grouped_stats = df.groupby('所有权')['资产负债率'].agg(['mean', 'var'])

# 打印结果
print(grouped_stats)
